查看原文
其他

科研实习 | 南方科技大学-香港中文大学(深圳)联合招收大语言模型算法实习生

帮你找学校的 AI求职
2024-08-22

合适的工作难找?最新的招聘信息也不知道?

AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!


单位与团队介绍

南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的教育培养和研究基地为目的。本系志在为国家培养出具有扎实的科学基础,思想活跃,创新意识和能力强,有国际视野,脚踏实地,有朝气、有理想的拔尖人才。本系已经建立起本硕博人才培养体系,拥有统计学和数据科学与大数据技术两个本科专业,及数学学科下概率论和数理统计硕博学位授予权,主要研究领域包括数理统计、生物医学统计、金融统计和数据科学。本目前共有17位教研序列教师和4位双聘教师,其中有讲席教授3人,教授4人,副教授6人,助理教授8人。统计系拥有国际化、高水平的师资队伍,包括1名国际数学家大会邀请报告人,2名国家自然科学奖二等奖获得者,1名长江讲座教授,2名国际数理统计学会(IMS)会士,1名IMS常务理事,1名美国统计学会(ASA)会士,1名IMS Medallion讲座演讲者,1名英国皇家统计学会会士、1名英国计算机学会会士,1名广东省特支科技创新青年拔尖人才,1名深圳市杰出人才培养对象,1名深圳市高层次国家级领军人才和2名深圳市优秀教师。


香港中文大学(深圳)数据科学学院师资团队现有62人(含兼职15人),其中校长学勤讲座教授4人、校长讲座教授10人、教授12人、副教授11人、助理教授23人、讲师1人。师资中包括加拿大皇家科学院和中国工程院外籍双院士1人、加拿大皇家科学院和加拿大工程院双院士1人、新加坡工程院院士1人、运筹学与管理学研究协会INFORMS会士1人、国际电气与电子工程学会IEEE会士4人、国际系统与控制科学院IASCYS 会士1人、国际数理统计学会IMS会士2人、美国工业与应用数学学会SIAM会士2人、国际语音通信学会ISCA会士1人、国家级高层次人才9人、省市区高层次人才7人。目前数据科学学院已录取的博士生均来自知名大学,如上海交通大学、浙江大学、南京大学、中国人民大学、中国科学技术大学、武汉大学、同济大学、香港中文大学(深圳)、南方科技大学等。本科专业包括数学与应用数学、计算机科学、信息科学、工业工程等。其中, 42%的学生本科成绩排名为专业前5%,80%的学生本科成绩排名为专业前10%。

导师简介

荆炳义教授,现任南方科技大学统计与数据科学系副系主任、讲席教授、南方科技大学大数据创新中心主任。于1993年在悉尼大学获得统计学博士学位,1992-1994 年在澳洲国立大学做博士后,师从国际著名统计学家Peter Hall 教授。1994-2021年在香港科技大学工作,任数学系教授、统计科学中心主任。荆炳义研究兴趣广泛,包括概率论与数理统计,金融计量及高频数据分析,机器学习理论与算法,生物信息,网络数据分析,强化学习等。他在各领域中有许多开创性研究,取得了很多突破性科研成果。共发表论文100余篇。荆炳义教授荣获2015年度国家自然科学奖二等奖, 教育部特聘教授,及两年度(2010,2015)获教育部高等学校自然科学奖二等奖。荆炳义教授是美国统计协会(ASA)和数理统计协会(IMS)会士(Fellow),国际统计学会(ISI)当选会士,泛华统计协会理事会成员,并先后分别担任七家国际期刊副主编。


2023年12月初,荆炳义教授课题组联合IDEA研究院发布34B Chat模型,具备超强多轮对话能力,在由美国Hugging Face社区支持的、致力于追踪、排名和评估大语言模型性能的开放大语言模型排行榜(Open LLM Leaderboard)中占据榜首,同时登顶上海AILab发布的Opencompass榜单同规模模型榜首,成为目前最具优势的开源34B指令微调模型之一。


个人主页:

https://faculty.sustech.edu.cn/?tagid=jingby&iscss=1&snapid=1&orderby=date&go=1


王本友,香港中文大学(深圳)助理教授,曾是欧盟玛丽居里研究员,于天津大学和意大利帕多瓦大学分别取得硕士和博士学位。主要研究方向为自然语言处理(NLP)、应用机器学习、和信息检索。曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。王本有助理教授曾获得国际信息检索顶级会议SIGIR 2017(CCF A类会议)最佳论文提名奖;博士期间获得国际NLP顶级会议NAACL 2019最佳可解释论文奖,该工作与NLP里程碑工作BERT同台领奖,长期担任ICLR/NeurIPS/ICML审稿人。发表包括国际顶级会议ICLR/NuerIPS/ACL/EMNLP/NAACL/  SIGIR/WWW和顶级期刊TOIS/TOC等20余篇,撰写的《推荐系统与深度学习》由清华大学出版社出版。

多模态大模型算法实习生

岗位职责

1. 参与多模态 (文本、图像、视频等) 大模型的研发和优化工作,协助进行模型的训练与调试;

2. 收集和处理多模态数据集,确保数据质量符合模型训练需求;

3. 协助团队进行相关算法的设计、训练和测试工作;

4. 追踪最新的人工智能研究进展,特别是多模态学习领域的前沿技术和应用。推进多模态大模型在业务场景的应用落地。

岗位要求

1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;

2. 在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、ALBEF、BEIT3、BLIP-2、LLaVA等多模态理解模型;

3. 具备良好的编程能力,熟练使用至少一种编程语言,如Python、Java或C++;

4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;

5. 有高质量论文发表者优先 (如CVPR, AAAI, NIPS, ICLR, TPAMI, ICCV, ECCV等);

6. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先;

7. 具有良好的英语读写能力,能够阅读和理解英文学术论文。

大语言模型算法实习生

岗位职责

1. 参与大语言模型在垂域的算法落地,根据业务需求开发定制化大语言模型,包括应用在AI Agent、虚拟对话、评论分析等业务场景;

2. 收集和处理垂域文本数据集,确保数据质量符合模型训练需求;

3. 负责提升大语言模型在检索增强、工具增强范式下的性能,提升检索和工具调用的准确度并降低内容生成的幻觉;

4. 参与深度学习和大语言模型研发相关工作,包括但不限于预训练、SFT、RLHF、Prompt调优、上下文窗口扩充、知识增强等。

岗位要求

1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;

2. 在NLP、LLM等方面有扎实的研究基础,熟悉主流模型和算法,如LLaMA、Yi、Qwen等主流LLM的架构和MoE、LORA等主流训练技术;

3. 熟悉大语言模型的原理和训练方法,有实际训练经验者优先;

4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;

5. 具备算法优化、模型量化、推理加速等工程能力和经验者优先;

6. 有高质量论文发表者优先 (如ICML, NIPS, ICLR, ACL, EMNLP等);

7. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先。

深度学习框架研发实习生

岗位职责

1. 参与开发优化大模型训练框架,支持单任务千卡规模的高效和稳定训练;

2. 参与大语言模型、多模态大模型结构设计,并联合业务和校企合作进行模型训练效率和性能的验证;

3. 参与文生图和文生视频的训练性能加速;

4. 参与低精度训练性能优化和长窗口训练性能优化。

岗位要求

1. 熟悉使用PyTorch框架,可对DataLoader数据迭代和DDP训练代码进行性能分析和优化;

2. 熟练使用主流大模型训练框架DeepSpeed、Megatron、Colossal。掌握3D并行、ZeRO机制、Flash-Attnetion等原理和可优化方向。具有vLLM、llama.cpp等推理框架的研发经验;

3. 有ViT、Stable Diffusion、DiT模型训练性能优化经验者优先;

4. 熟练掌握CUDA性能优化手段,能够进行算子的拆分和融合,进行并行算法设计和优化,有算子编写优化项目经验者优先;

5. 有使用cutlass2/3进行深度学习相关算子开发,有复现接近cuBLAS效率kernel开发,有写过pytorch cuda extenti的优先。

福利待遇

1. 日薪350~500元(可覆盖在深生活开销,租房约1500元/月),可根据候选人的经验和技能水平确定薪资;

2. 优秀者可推荐攻读香港中文大学(深圳)数据科学哲学硕士/博士项目, 并提供最多全额的奖学金(与香港中文大学深圳的奖学金不冲突);

3. 实习期间提供计算资源、舒适的办公环境用于科学研究。

平台资源

1. 可为实习生提供南科大丰富优质的图书馆资源,AI和交叉学科领域拥有雄厚的师资力量;

2. 实习期间中心提供计算资源、舒适的办公环境用于科学研究;3. 可参与课题组科研项目,并可作为论文合作者;

4. 与华为、IDEA、UCloud、滴谱、鹏程实验室等有深度合作,也可提供内推机会。

申请方式

邮箱:data@sustech.edu.cn

电话:0755-88015665







实习内推

腾讯QQ影像中心度小满科技创新业务部零一万物京东智能客服团队北京通用人工智能研究院百度文心一言团队微软亚洲互联网工程院阿里通义实验室度小满金融数字人团队腾讯基础微信&视频号团队微软WWE大模型团队中电信AI公司VIVO影像算法研究部北京智源人工智能研究院字节跳动国际化短视频团队小红书智能创作团队微软亚洲研究院智谱AI浙江清华长三角研究院Infinity Ground阿里通义灵码团队腾讯PCG大搜团队百度智能办公平台部VIVO AI研究院京东物流地图数据部门微软亚洲研究院腾讯混元AIGC团队商汤基础多模态大模型组AMD北京AI算法团队小红书信息流算法组海康威视研究院亚马逊上海人工智能研究院腾讯AI Lab校招岗位智源人工智能研究院阿里云PAI深度学习算法团队秘塔科技美柚研究院百度搜索策略部淘宝搜索算法团队百川智能IDEA数字经济研究院百度搜索策略部阿里达摩院视觉技术实验室地平线阿里巴巴淘天集团阿里达摩院对话智能团队百度文心一言团队京东零售内容算法部蚂蚁网商银行智能引擎团队腾讯AI Lab决策智能中心理想汽车智能座舱团队阿里通义实验室对话智能团队元象XVERSE蚂蚁集团算法数据技术团队腾讯游戏AI大语言模型团队秘塔科技上海算法创新研究院VIVO影像算法研究部亚马逊上海人工智能研究院社招岗位

蚂蚁集团机器智能团队腾讯游戏AI大语言模型团队京东广告研发部阿里通义实验室对话智能团队NVIDIA中国腾讯混元大模型团队秘塔科技途深智合蚂蚁集团风险智能团队昆仑万维AI游戏团队小红书社区搜索组阿里达摩院多模态团队上海算法创新研究院新东方教育科技集团快手大模型训练引擎团队小红书快手大模型中心VIVO影像算法研究部小红书智能创作团队京东零售九数算法中台Infinity GroundOPPO AI中心大模型算法部上海期智研究院抖音搜索生活服务团队腾讯混元AIGC团队亚马逊上海人工智能研究院

高校招生

香港大学陈怡老师香港理工大学姚岱教授哈尔滨工业大学(深圳)万佳教授香港科技大学(广州)骆昱宇教授澳门大学郑哲东教授大湾区大学乔子越老师西湖大学蓝振忠老师香港科技大学(广州)丁宁宁老师大湾区大学余梓彤老师香港中文大学(深圳)陈锐老师香港科技大学(广州)汤南教授医疗大数据与医学智能实验室香港理工大学林婉瑜老师香港科技大学郭嵩教授亚利桑那大学杨幻睿老师中山大学苗嘉旭教授香港科技大学(广州)谢泽柯老师武汉大学罗勇教授上海交通大学张倬胜老师香港中文大学(深圳)林天麟老师香港城市大学马佳葳老师南方科技大学张建国教授浙江大学智能生物医用大分子实验室香港科技大学雪巍老师


加入社群  🌟


为了更好地了解和满足大家的需求,我们建立了「求职者社群」

加入 AI 求职社群,你可以享有招聘需求曝光获取最新面试经验校招准备攻略硕博招生独家内推渠道等服务。

扫描下方小助手的微信,pick 你心仪的岗位~




如何发布招聘

AI 求职是「PaperWeekly」旗下聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。

目前已有百度、阿里、腾讯、字节跳动等企业发布内推岗位,欢迎大家订阅关注、发布岗如果你也想对公司和在招职位进行更多曝光,请联系我们的栏目负责人(微信:pwbot02)。
·
·
继续滑动看下一个
AI求职
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存